# Introdução à Programação em Python
## Notebook 10 - Programação orientada a objectos
## Carlos Caleiro, Jaime Ramos
## Dep. Matemática, IST - 2016

(actualizado em 8 de Fevereiro de 2018)

# Programação com objectos

Já mencionámos antes que a linguagem *Python* é orientada a objectos, mas sem aprofundar o verdadeiro significado e alcance deste facto. Vimos, nomeadamente a propósito de tipos mutáveis, como listas, a que corresponde a ideia de que manipulamos objectos cujo valor associado pode ir mudando ao longo de uma computação. Mas vale a pena compreender o que isto de facto significa.

Antes de mais, a orientação a objectos é um paradigma que ao invés de separar valores e funções, dados e computação, advoga que a cada valor estão necessariamente associadas as operações disponíveis para o manipular. Assim, um objecto pode ser entendido como uma unidade básica de modularização que agrega, em simultâneo, valores (ditos *atributos*) e funcionalidades (ditas *métodos*). Mais ainda, numa linguagem fortemente tipada como *Python*, o menu de atributos e métodos de um dado objecto determina precisamente o seu tipo (ou *classe*).

A noção de *classe* é talvez a mais importante da programação orientada a objectos, pois é especificando uma classe que determinamos o comportamento possível dos objectos que são instância da classe. Outra dimensão igualmente importante tem a ver com a hierarquização das classes ou tipos, através do mecanismo de *herança*. Estes são assuntos que são abordados cabalmente em disiciplinas sobre Programação com Objectos, mas que ilustraremos, ainda que superficialmente, neste capítulo.

# Objectos e métodos

A ideia mais poderosa associada à noção de objecto é a de *encapsulamento do estado*: o estado do objecto, determinado pelo valor dos seus atributos, deve estar escondido do utilizador, sendo a invocação dos métodos disponíveis a única forma de observar/alterar esse estado. Na verdade, em *Python*, esta ideia não é levada até às últimas consequências, pois é sempre possível aceder directamente ao valor dos atributos de um objecto (no sentido em que a observação/alteração directa dos atributos está por defeito incluída no menu de métodos disponíveis).

Apesar disso, é possível manter a ideia original intacta se evitarmos aceder ao atributos directamente (é usual em *Python* incluir atributos/métodos nas definições com designações iniciadas por `_`, que tendo algum significado interno relevante, não devem nunca ser utilizadas directamente).

Os exemplos mais interessantes de objectos que vimos dizem respeito aos tipos mutáveis. Analisemos o caso dos dicionários, que abordámos pela rama no NB03.

In [1]:
?dict

In [2]:
pauta={}

In [3]:
pauta[333]=20

In [4]:
pauta[334]=10

In [5]:
pauta

{333: 20, 334: 10}

In [8]:
335 in pauta

False

Os dicionários (ou registos) são semelhantes a listas, mas com as posições nomeadas por um referente. Notacionalmente, usam-se chavetas, em vez de parênteses rectos. Num dicionário a ordem não é importante pois os valores são indexados usando o referente como chave.

Atentemos nos métodos disponíveis para os objectos desta classe.

In [23]:
dir(dict)

['__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

A primeira série de métodos dos dicionários são métodos *internos*, que servem funções específicas mas que não devem ser invocados directamente. O método `__iter__`, por exemplo, existe por se tratar de um tipo iterável, para o qual está disponível um certo *protocolo de iteração* que abordaremos de seguida.

Os restantes métodos, com nomes iniciados por letras, disponibilizam funcionalidades simples. Por exemplo, `clear` limpa os conteúdos de um dado dicionário.

In [9]:
pauta

{333: 20, 334: 10}

In [10]:
copia=pauta
copia.clear()
copia

{}

In [14]:
pauta

{333: 20}

In [11]:
pauta[333]=20

In [12]:
copia[333]

20

O método seguinte, `copy` serve precisamente o propósito de criar uma cópia do dicionário, mas como um outro objecto.

In [15]:
copia=pauta.copy()

In [16]:
pauta,copia

({333: 20}, {333: 20})

In [17]:
pauta.clear()

In [18]:
pauta,copia

({}, {333: 20})

Vale a pena compreender as funcionalidades disponibilizadas por cada um dos restantes métodos.

## Geradores e iteradores

Como já sabemos há, em *Python* objectos de tipos ditos *iteráveis*, que incluem dicionários e listas, mas também tuplos, `range`s e ficheiros. Todos os estes tipos dispõem de um método interno `__iter__`, invocável através da função predefinida `iter`, que transforma um tal objecto num iterador.

O iterador, por sua vez, dispõe de um método interno `__next__`, invocável através da função predefinida `next`, que permite aceder sequencialmente aos seus valores. É este o processo utilizado pelo *Python* para a execução de ciclos `for`.

Para ilustração, veja-se o que acontece no caso das listas.

In [29]:
w=[1,2,3]
witer=iter(w)
w.append(4)

In [2]:
dir(witer)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__iter__',
 '__le__',
 '__length_hint__',
 '__lt__',
 '__ne__',
 '__new__',
 '__next__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setstate__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

In [30]:
next(witer)

1

In [31]:
next(witer)

2

In [32]:
next(witer)

3

In [33]:
next(witer)

4

In [61]:
w

[1, 2, 3]

Esta sequência de avaliações é bem elucidativa: o nome `witer` é associado ao iterador correspondente à lista `[1,2,3]`. Cada invocação de `next(witer)` produz o próximo valor da sequência e altera, por efeito colateral, o estado interno do objecto iterador.

Trata-se de uma ideia particularmente poderosa e apelativa, que admite a possibilidade de construir iteradores infinitos. A extensão do *Python* chamada `itertools` providencia algumas funcionalidades interessantes sobre iteradores (possivelmente infinitos).

In [34]:
from itertools import *

In [35]:
mult5=count(0,5)

In [36]:
next(mult5)

0

In [37]:
next(mult5)

5

In [38]:
next(mult5)

10

É fácil compreender o comportamento do iterador `mult5` definido pela função `count` disponibilizada por `itertools`, pois trata-se de uma versão infinitária do mais usual `range`. Vale a pena explorar outras funcionalidades disponibilizadas pelo módulo `itertools`, mas mais interessante ainda será percebermos como construir directamente os nossos próprios iteradores (finitos ou infinitos).

A ideia passa, em *Python*, por aquilo a que se designa de *definição geradora*, ou simplesmente de *gerador*. Um gerador é um programa (objecto) que retorna valores através da primitiva `yield`, ao invés da usual primitiva `return`. A diferença reside no facto de `yield` congelar o estado interno do programa (objecto) que pode ser retomado mais adiante e continuado até à próxima ocorrência de `yield`. O objecto gerador dá origem a um iterador, e portanto é conforme o protocolo de iteração descrito acima, sendo os valores retornados por `next` os correspondentes à sequência de `yield`s da sua execução.

Considere-se a seguinte definição, muito simples, de um gerador (infinito) dos números naturais.

In [39]:
def naturals(i):
    x=i
    while True:
        yield x
        x+=1

In [40]:
nats=naturals(0)

In [41]:
next(nats)

0

In [45]:
next(nats)

4

É simples, por exemplo, definir iteradores que devolvem valores, alternadamente, de dois iteradores dados. 

In [46]:
def zip(a,b):
    while True:
        yield next(a)
        a,b=b,a

In [47]:
seq=zip(naturals(0),naturals(10))

In [48]:
next(seq)

0

In [49]:
next(seq)

10

In [50]:
next(seq)

1

In [51]:
next(seq)

11

Ainda mais interessante é a seguinte implementação do chamado *crivo de Eratóstenes*, um teste de primalidade que assenta na ideia muito simples de que podemos, por cada número primo que descobrimos, excluir todos os seus múltiplos. Consideramos aqui um gerador dos números primos menores que um dado valor.

In [52]:
def crivo(n):
    poss=[False]*2+[True]*(n-2)
    for i in range(2,n):
        if poss[i]:
            for j in range(i**2,n,i):
                poss[j]=False
            yield i

Vale a pena notar que `poss` é uma lista de Booleanos que indica a cada passo quais os números que não são primos, e quais são aqueles para os quais ainda não foi encontrado um divisor. Note-se que cada primo `i` que é encontrado exclui todos os seus múltiplos apenas a partir de `i**2` (porquê?).

Usando este iterador, é muito fácil, por exemplo somar todos os números primos menores que 2 milhões.

In [54]:
list(crivo(20))

[2, 3, 5, 7, 11, 13, 17, 19]

In [55]:
%time sum(crivo(2000000))

CPU times: user 580 ms, sys: 9.92 ms, total: 590 ms
Wall time: 589 ms


142913828922

Ainda mais interessante será usar a ideia subjacente ao crivo de Eratóstenes para construir um gerador da sequência infinita de todos os números primos. Claro que sem a limitação finita, se torna impraticável filtrar correctamente o crivo em cada passo. No entanto, é possível guardar apenas informação relevante de filtragem, como se segue, usando um dicionário.  

In [56]:
def crivo_inf():
    regras = {}
    q = 2  # primeiro primo
    while True:
        print(regras)
        if q not in regras:
            # q não está marcado como composto, deve ser primo  
            yield q 
            # regra para excluir o primeiro múltiplo de q ainda não marcado
            regras[q * q] = [q]
        else:
            for p in regras[q]:
                # filtrar p+q também com q
                if p+q in regras:
                    regras[p+q].append(p)
                else:
                    regras[p+q]=[p]
            # regras[q] irrelevantes para a frente
            del regras[q]
        q += 1

In [57]:
primos = crivo_inf()
[next(primos) for i in range(10)]

{}
{4: [2]}
{9: [3], 4: [2]}
{9: [3], 6: [2]}
{9: [3], 6: [2], 25: [5]}
{8: [2], 9: [3], 25: [5]}
{49: [7], 25: [5], 8: [2], 9: [3]}
{49: [7], 25: [5], 9: [3], 10: [2]}
{49: [7], 25: [5], 10: [2], 12: [3]}
{49: [7], 25: [5], 12: [3, 2]}
{49: [7], 25: [5], 121: [11], 12: [3, 2]}
{49: [7], 25: [5], 121: [11], 14: [2], 15: [3]}
{49: [7], 169: [13], 25: [5], 121: [11], 14: [2], 15: [3]}
{16: [2], 49: [7], 169: [13], 25: [5], 121: [11], 15: [3]}
{16: [2], 49: [7], 18: [3], 169: [13], 25: [5], 121: [11]}
{49: [7], 18: [3, 2], 169: [13], 25: [5], 121: [11]}
{289: [17], 169: [13], 49: [7], 18: [3, 2], 121: [11], 25: [5]}
{289: [17], 169: [13], 49: [7], 20: [2], 21: [3], 121: [11], 25: [5]}
{289: [17], 169: [13], 49: [7], 20: [2], 21: [3], 121: [11], 25: [5], 361: [19]}
{289: [17], 169: [13], 49: [7], 21: [3], 22: [2], 121: [11], 25: [5], 361: [19]}
{289: [17], 169: [13], 49: [7], 22: [2], 121: [11], 24: [3], 25: [5], 361: [19]}
{289: [17], 169: [13], 49: [7], 121: [11], 24: [3, 2], 25: [5], 36

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]

Obviamente, depois de compreendido o programa, vale a pena apagar a linha `print(regras)`.

# Classes

Já vimos como programar utilizando objectos das classes predefinidas do *Python*, mas ainda não sabemos como especificar novas classes (tipos) de objectos. 

Vamos de seguida ilustrar essa possibilidade como forma alternativa de representar tipos de dados, nomeadamente no contexto do método de programação em larga escala centrado nos dados (NB08).

## Implementação de tipos de dados

Até agora, um tipo de dados foi definido apenas pela colecção de operações que o manipula. No entanto, a linguagem *Python* disponibiliza uma construção, a *classe*, que permite uma implementação mais natural de tipos de dados abstractos. Embora as classes sejam uma construção bastante rica, com aplicações na programação orientada a objectos, por agora vamo-nos concentrar apenas na sua utilização para a definição de tipos de dados abstractos.

Como dissemos, uma *classe* define um tipo de dados (ou mais correctamente, um *tipo de objectos*). Apresentamos em seguida a especificação da *classe* para o tipo *pilha*:

In [58]:
class stack():
    
    def __init__(self):
        self._list=[]
        
    def push(self,x):
        self._list.append(x)
        
    def pop(self):
        if len(self._list)>0:
            self._list=self._list[:len(self._list)-1]
        else:
            print("Erro leave! A pilha esta vazia")
            
    def top(self):
        if len(self._list)>0:
            return self._list[len(self._list)-1]
        else:
            print("Erro first! A pilha está vazia")
            
    def emptyQ(self):
        if self._list==[]:
            return True
        else:
            return False

Ao definir a classe `stack` criámos um novo *tipo* também chamado `stack`. Os elementos deste tipo chamam-se **instâncias** do tipo ou **objectos**. À criação de uma nova instância dá-se o nome de **instanciação**. A criação de novas instâncias é obtida através da invocação do nome da classe. Por exemplo, podemos instanciar um objecto `stack` invocando a classe `stack`.

In [59]:
s=stack()

Com este comando, atribuímos à variável `s` uma referência a um novo objecto `stack` inicializado de acordo com o método `__init__`. 

Analisemos agora em detalhe a definição da classe `stack`. A informação, os valores, de cada instância é armazenada em **atributos**. No caso da classe `stack` temos apenas um atributo, o atributo `_list`, a lista onde vão sendo guardados os elementos que vão sendo sobrepostos na pilha, à semelhança do que foi feito anteriormente. 

Na verdade o atributo deve ser mantido privado, razão pela qual o nome do atributo começa com `_`, devendo toda e qualquer manipulação do atributo ser efectuada por via dos métodos disponibilizados. Infelizmente, em *Python*, não é possível impor esta restrição. Na verdade, podemos sempre consultar o valor do atributo de um objecto directamente.

In [60]:
s._list

[]

Tal como podemos consultar directamente os atributos de um objecto, também os podemos alterar directamente.

In [61]:
x=stack()
x._list.append(1)
x._list

[1]

No entanto, esta prática deve ser **evitada** a todo o custo. A manipulação dos atributos de um objecto deve ser  feita recorrendo exclusivamente aos *métodos* disponibilizados pela classe. Respeitar esta restrição é uma excelente forma de pugnar pela **independência da implementação**, que é um dos pilares do método da programação por camadas.

Assim, a manipulação do objecto é feita exclusivamente através de **métodos**. Um método comporta-se como uma função mas faz parte do objecto. Recorde-se que esta não é a primeira vez que fazemos referência à noção de *método* para manipular objectos. Tal foi referido quando se estudaram, por exemplo, as listas. No caso da classe `stack`, foram definidos 5 métodos: `__init__`, `push`, `pop`, `top` e `emptyQ`. Os 4 últimos métodos correspondem às operações sobre pilhas com o mesmo nome identificadas no início do capítulo. No entanto, o leitor mais atento reparará que a operação `new` não está definida nesta classe. Tal deve-se a uma opção de implementação. Optámos por definir a classe de forma a que de cada vez que se cria uma nova instância, essa instância é criada como uma pilha vazia. Tal é conseguido através do **método de inicialização** `__init__`. O método de inicialização é chamado automaticamente de cada vez que a classe é invocada (para a criação de novas instâncias) e permite definir as características iniciais de cada objecto. Este método admite parâmetros adicionais para fixar outros valores iniciais e adiante serão apresentados exemplos.

Seguem-se alguns exemplos que ilustram a utilização da classe `stack`.

In [62]:
s.push(1)

Este comando sobrepõe o número 1 no topo da pilha. Com efeito, podemos confirmar isso mesmo usando o método `top`:

In [63]:
s.top()

1

Podemos continuar a sobrepôr elementos na pilha `s`:

In [64]:
s.push(2)

In [65]:
s.push(3)

In [66]:
s.top()

3

In [67]:
s.pop()

In [68]:
s.top()

2

Ao definir um método, o primeiro parâmetro refere-se à instância em causa. Quer seja uma instância que está ser criada, no caso do método de inicialização, ou uma instância que já existe, no caso dos outros métodos. É usual chamar a este parâmetro `self`. Considerem-se os seguintes exemplos:

In [12]:
r=stack()

In [13]:
r.push("Ana")

In [14]:
r.top()

'Ana'

In [15]:
s.top()

2

**Exercício:** Deixa-se como exercício modificar o programa Hanoi, adaptando-o a esta nova definição das pilhas.

**Exercício:** Deixa-se como exercício definir a classe `queue` das filas de espera.

## Subclasses, herança e redefinição de métodos

Um dos mecanismos essenciais da programação orientada a objectos, e consequentemente do sistema de tipos da linguagem *Python*, é a noção de *subclasse*. Uma subclasse é uma especialização de outra (ou outras classes). Cada objecto da subclasse é também um objecto da classe.

Atente-se no seguinte exemplo, que consiste na implementação usando classes de um tipo de dados `stack of numbers` que na verdade é essencialmente uma pilha, mas onde faz sentido, por exemplo, calcular a média dos seus elementos (o que claramente não é o caso de toda e qualquer pilha). Para melhor ilustrar a construção optamos por implementar os objectos do novo tipo de dados como pilhas com um atributo adicional (o número de elementos na pilha) e um método adicional para calcular a média dos seus elementos.

In [69]:
class stackofnums(stack):

    def __init__(self):
        stack.__init__(self)
        self._length=0
        
    def push(self,x):
        self._list.append(x)
        self._length+=1
        
    def pop(self):
        if self._length>0:
            self._list=self._list[:self._length-1]
            self._length-=1
        else:
            print("Erro leave! A pilha esta vazia")
            
#    def top(self):
#        if len(self._list)>0:
#            return self._list[len(self._list)-1]
#        else:
#            print("Erro first! A pilha está vazia")
            
    def emptyQ(self):
        return self._length==0
            
    def average(self):
        return sum(self._list)/self._length


Vale a pena reparar que o método `__init__` invoca o método correspondente de `stack`. Note-se ainda que o método `average` é novo, pelo que só está disponível para objectos da subclasse. Além disso, pelo mecanismo conhecido como *herança*, a subclasse herda todos os métodos já disponibilizados pela classe original. É o caso do método `top`. Note-se ainda que o mecanismo de herança permite a redefinição de alguns métodos, como é o caso de `push`, `pop` e `emptyQ` neste exemplo.

In [70]:
s=stackofnums()
s.push(2)
s.push(7)
s.pop()
s.push(8)
s.top()

8

In [71]:
s.average()

5.0

In [72]:
dir(s)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_length',
 '_list',
 'average',
 'emptyQ',
 'pop',
 'push',
 'top']

Finalmente, vale a pena explorar todos os métodos adicionais (privados e internos) que as nossas definições, tão singelas, ganham por defeito, e que permitem a articulação de todo o sistema subjacente à linguagem *Python*.

# Sumário

* O conceito de objecto é baseado na ideia de que a cada valor deve estar indissociavelmente ligado o conjunto das funcionalidades disponíveis para o manipular.
* Em Python, cada valor (objecto) pertence a um determinado tipo (classe). A forma que temos de enriquecer o sistema de tipos da linguagem é a definição de novas classes.
* Variando com a classe em causa, um objecto é determinado pelos seus atributos (que devem ser mantidos privados) e manipulado por invocação dos métodos disponibilizados pela classe.
* Os objectos instância de uma classe serão mutáveis consoante a classe seja especificada por forma a disponibilizar métodos que alterem os seus atributos, ou caso os atributos sejam eles próprios de tipos mutáveis.
* O mecanismo de herança na definição de subclasses é monótono, excepto se métodos originais da classe forem redefinidos. 

# Bibliografia

*Introdução à Programação em Mathematica* (3a edição): J. Carmo, A. Sernadas, C. Sernadas, F. M. Dionísio, C. Caleiro, IST Press, 2014.

*Think Python: How to think like a computer scientist*: A. Downey, Green Tea Press, 2012.

*Introduction to Computation and Programming Using Python* (revised and expanded edition): J. V. Guttag, MIT Press,  2013.

*The Art of Computer Programming*: D. E. Knuth, Addison-Wesley (volumes 1--3, 4A), 1998.

*Learning Python* (fifth edition): M. Lutz, O'Reilly Media,  2013.

*Programação em Python: Introdução à programação utilizando múltiplos paradigmas*: J. P. Martins, IST Press, 2015.

*Introdução à Programação em MatLab*: J. Ramos, A. Sernadas e P. Mateus, DMIST, 2005. 

*Learning IPython for Interactive Computing and Data Visualization*: C. Rossant, Packt Publishing,  2013.

*Programação em Mathematica*: A. Sernadas, C. Sernadas e J. Ramos, DMIST, 2003.